AI资讯新闻榜单内容搜索-LLM

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: LLM
阿里智能化研发起飞!RTP-LLM 实现 Cursor AI 1000 token/s 推理技术揭秘

阿里智能化研发起飞!RTP-LLM 实现 Cursor AI 1000 token/s 推理技术揭秘

阿里智能化研发起飞!RTP-LLM 实现 Cursor AI 1000 token/s 推理技术揭秘

RTP-LLM 是阿里巴巴大模型预测团队开发的高性能 LLM 推理加速引擎。它在阿里巴巴集团内广泛应用,支撑着淘宝、天猫、高德、饿了么等核心业务部门的大模型推理需求。在 RTP-LLM 上,我们实现了一个通用的投机采样框架,支持多种投机采样方法,能够帮助业务有效降低推理延迟以及提升吞吐。

来自主题: AI技术研报
7320 点击    2025-04-14 15:13
用 Agent 重塑生产力!揭秘扣子的史诗级三大更新,还有三个彩蛋!

用 Agent 重塑生产力!揭秘扣子的史诗级三大更新,还有三个彩蛋!

用 Agent 重塑生产力!揭秘扣子的史诗级三大更新,还有三个彩蛋!

LLM Agent 火了两年了,但业界仍然存在许多非共识。智能体数量卷上去了,概念炒上去了,但质量参差不齐,娱乐向的不好玩,提效向的不好用,具体企业落地更是各种大小问题不断。

来自主题: AI资讯
5803 点击    2025-04-10 09:41
从0到1玩转MCP:AI的「万能插头」,代码手把手教你!

从0到1玩转MCP:AI的「万能插头」,代码手把手教你!

从0到1玩转MCP:AI的「万能插头」,代码手把手教你!

在人工智能飞速发展的今天,LLM 的能力令人叹为观止,但其局限性也日益凸显 —— 它们往往被困于训练数据的「孤岛」,无法直接触及实时信息或外部工具。

来自主题: AI技术研报
8517 点击    2025-04-06 15:58
这篇综述,LLM代理的方法、应用和挑战,2025的Agent势头特别猛。| 重磅

这篇综述,LLM代理的方法、应用和挑战,2025的Agent势头特别猛。| 重磅

这篇综述,LLM代理的方法、应用和挑战,2025的Agent势头特别猛。| 重磅

2025年,人工智能领域正在经历一场由LLM Agent引发的深刻变革,不管普通人的衣食住行还是研究者的尖端研究,都很难不受Agent的影响。

来自主题: AI技术研报
10375 点击    2025-04-01 10:06
Multi-Agents 系统太难搞了,不要轻易尝试 | UC Berkeley 论文分享

Multi-Agents 系统太难搞了,不要轻易尝试 | UC Berkeley 论文分享

Multi-Agents 系统太难搞了,不要轻易尝试 | UC Berkeley 论文分享

这两年,AI 领域最激动人心的进展莫过于大型语言模型(LLM)的崛起,LLM 展现了惊人的理解和生成能力。

来自主题: AI技术研报
8945 点击    2025-03-28 09:33
拾象科技万字详解MCP:Agentic AI中间层最优解,以及创业公司的三个机会

拾象科技万字详解MCP:Agentic AI中间层最优解,以及创业公司的三个机会

拾象科技万字详解MCP:Agentic AI中间层最优解,以及创业公司的三个机会

在拾象团队的 2025 的 AI 关键预测中,我们提到:随着 Agent 时代到来,OS 才是 LLM 厂商们最高的护城河,从 computer use 到 MCP,Anthropic 构建 OS 的决心是 AI labs 中最强、最明显的。

来自主题: AI技术研报
10578 点击    2025-03-26 10:14
亲自说说字节 TopSeed 怎么样!

亲自说说字节 TopSeed 怎么样!

亲自说说字节 TopSeed 怎么样!

清华智能产业研究院(AIR)博三在读,去年六月份,出于对语言模型 LLM 的强烈兴趣,加入了字节 as Top Seed Intern,在人工智能的最前沿进行探索。刚好这个话题和我现在做的工作强相关,我分享一下自己的观点和亲身体验。

来自主题: AI资讯
9373 点击    2025-03-23 15:09
一个算法让LLM创新能力暴增,原来是AI学会了进化

一个算法让LLM创新能力暴增,原来是AI学会了进化

一个算法让LLM创新能力暴增,原来是AI学会了进化

如果你让当今的 LLM 给你生成一个创意时钟设计,使用提示词「a creative time display」,它可能会给出这样的结果:

来自主题: AI技术研报
8472 点击    2025-03-20 16:15
原作者带队再次改造xLSTM,7B模型速度最快超Mamba 50%,权重代码全开源

原作者带队再次改造xLSTM,7B模型速度最快超Mamba 50%,权重代码全开源

原作者带队再次改造xLSTM,7B模型速度最快超Mamba 50%,权重代码全开源

近年来,大型语言模型(LLM)通过大量计算资源在推理阶段取得了解决复杂问题的突破。推理速度已成为 LLM 架构的关键属性,市场对高效快速的 LLM 需求不断增长。

来自主题: AI技术研报
5762 点击    2025-03-20 09:26